107 research outputs found

    Fast object detection in compressed JPEG Images

    Full text link
    Object detection in still images has drawn a lot of attention over past few years, and with the advent of Deep Learning impressive performances have been achieved with numerous industrial applications. Most of these deep learning models rely on RGB images to localize and identify objects in the image. However in some application scenarii, images are compressed either for storage savings or fast transmission. Therefore a time consuming image decompression step is compulsory in order to apply the aforementioned deep models. To alleviate this drawback, we propose a fast deep architecture for object detection in JPEG images, one of the most widespread compression format. We train a neural network to detect objects based on the blockwise DCT (discrete cosine transform) coefficients {issued from} the JPEG compression algorithm. We modify the well-known Single Shot multibox Detector (SSD) by replacing its first layers with one convolutional layer dedicated to process the DCT inputs. Experimental evaluations on PASCAL VOC and industrial dataset comprising images of road traffic surveillance show that the model is about 2Ă—2\times faster than regular SSD with promising detection performances. To the best of our knowledge, this paper is the first to address detection in compressed JPEG images

    DAN: a Segmentation-free Document Attention Network for Handwritten Document Recognition

    Full text link
    Unconstrained handwritten text recognition is a challenging computer vision task. It is traditionally handled by a two-step approach, combining line segmentation followed by text line recognition. For the first time, we propose an end-to-end segmentation-free architecture for the task of handwritten document recognition: the Document Attention Network. In addition to text recognition, the model is trained to label text parts using begin and end tags in an XML-like fashion. This model is made up of an FCN encoder for feature extraction and a stack of transformer decoder layers for a recurrent token-by-token prediction process. It takes whole text documents as input and sequentially outputs characters, as well as logical layout tokens. Contrary to the existing segmentation-based approaches, the model is trained without using any segmentation label. We achieve competitive results on the READ 2016 dataset at page level, as well as double-page level with a CER of 3.43% and 3.70%, respectively. We also provide results for the RIMES 2009 dataset at page level, reaching 4.54% of CER. We provide all source code and pre-trained model weights at https://github.com/FactoDeepLearning/DAN

    Probability distributions for polymer translocation

    Full text link
    We study the passage (translocation) of a self-avoiding polymer through a membrane pore in two dimensions. In particular, we numerically measure the probability distribution Q(T) of the translocation time T, and the distribution P(s,t) of the translocation coordinate s at various times t. When scaled with the mean translocation time , Q(T) becomes independent of polymer length, and decays exponentially for large T. The probability P(s,t) is well described by a Gaussian at short times, with a variance that grows sub-diffusively as t^{\alpha} with \alpha~0.8. For times exceeding , P(s,t) of the polymers that have not yet finished their translocation has a non-trivial stable shape.Comment: 5 pages, 4 figure

    A syntax directed method for numerical field extraction in incoming mail documents

    Get PDF
    In this article, we propose a generic method for the automatic localisation and recognition of numerical fields (phone number, ZIP code, etc.) in unconstrained handwritten incoming mail documents. The method exploits the syntax of a numerical field as an a priori knowledge to locate it in the document. A syntactical analysis based on Markov models filters the connected component sequences that respect a particular syntax known by the system. Once extracted, the fields are submitted to a numeral recognition process. Hence, we avoids an integral recognition of the document, which is a very tough and time consuming task. We show the efficiency of the method on a real incoming mail document database.Dans cet article, nous présentons une méthode générique d'extraction et de reconnaissance de champs numériques (numéro de téléphone, code postal, etc.) dans des courriers manuscrits non contraints. La méthode d'extraction exploite la syntaxe des champs comme information a priori pour les localiser. Un analyseur syntaxique à base de modèles de Markov filtre les séquences de composantes qui respectent la syntaxe d'un type de champ connu du système. Notre approche permet ainsi d'éviter la reconnaissance totale du document, opération délicate et coûteuse en temps de calcul, puisque seuls les champs localisés sont soumis à un système de reconnaissance. Nous montrons l'efficacité de la méthode sur une base de courriers manuscrits réels de type courrier entrant

    Apprentissage multiclasse en environnement incertain

    Get PDF
    International audienceDans cet article, nous abordons le problème de la classification multiclasses dans le contexte particulier où les coûts de mauvaise classification sont déséquilibrés en fonction des classes et sont inconnus lors de l’apprentissage mais disponibles en prédiction. La méthode proposée s’appuie sur des ensembles de classifieurs, chacun spécialisé à des contextes de coûts particuliers. Pour cela,elle combine une procédure d’optimisation multi-objectifs avec une décomposition par paires de classes, afin de réduire la complexité computationnelle. Les prédictions sont ensuite obtenues via la sélection du classifieur le plus adapté aux coûts, une fois que ceux-ci sont connus. Les premiers résultats obtenus montrent que cette méthode est efficace et qu’elle permet de traiter des problèmes avec un grand nombre de classes

    Morphogenèse du mélanome in situ

    Get PDF
    Melanoma is the leading cause of death from skin cancer. However if it is detected early, it can be treated by simple excision and the prognosis is excellent. Clinical diagnosis is based on various morphological features of the skin lesion but little is known about the mechanisms responsible for generating the shapes and microstructures typical of melanoma. The aim of this work is to explore the morphogenetic processes involved during the development of melanocytic lesions using the tools of macroscopic physics. We first derive a multiphase model in a lubrication limit to describe the radial growth phase of melanoma in the epidermis. We prove analytically and numerically the occurrence of a contour instability leading to the apparition of undulations that we compare to the irregular border often observed in melanoma. The analytical results correlate the microscopic properties of the tumor to its macroscopic shape and evolution. We then demonstrate the possibility of a spinodal decomposition in the class of multiphase model considered and leading to cell aggregation. We show how the behavior of the aggregates is perturbed at long time by the mechanisms regulating cell proliferation and find the existence of a steady state where tumor cells are organized symmetrically, in dots, in lines or in a grid-pattern. These results explain the presence of dots and globules in pigmented lesion, uniform in size, shape and distribution in benign lesions and more irregular in melanoma. Focusing finally on glabrous skin, we investigate how the particular geometry of the epidermis in these regions influences the appearance of pigmented lesions. By modeling melanin transport we present a mechanism explaining the apparition of a parallel pattern and the localization of melanin columns. To investigate how geometry influence the repartition of tumor cells we derive a multiphase model describing growth in a thin curved layer, showing how cell aggregates are found in epidermal ridges.Le mélanome est le cancer de la peau le plus mortel. S'il est détecté de manière précoce il peut cependant être traité par simple excision et les chances de guérison sont alors très bonnes. Des algorithmes de diagnostic différentiels basés sur des critères morphologiques permettent ainsi de distinguer cette tumeur d'autres lésions bénignes présentes à la surface de la peau. Les mécanismes engendrant les formes et les microstructures caractéristiques d'un mélanome restent cependant pratiquement inconnus. L'objectif de ce travail est d'éclairer les processus morphogénétiques à l'oeuvre lors du développement des tumeurs mélanocytaires à l'aide des outils de la physique macroscopique. On commence par développer un modèle multiphase en couche mince pour décrire la croissance du mélanome dans l'épiderme. On montre analytiquement et numériquement l'existence d'une instabilité conduisant à l'apparition d'ondulations sur le contour d'une lésion initialement circulaire que l'on compare avec les irrégularités de contour fréquemment observées dans les mélanomes. L'identification des paramètres contrôlant cette instabilité permet ainsi de corréler les propriétés microscopiques de la tumeur à la forme et l'évolution macroscopique de la lésion. On montre ensuite la possibilité d'une décomposition spinodale dans cette classe de modèle multiphase, engendrant la formation d'agrégats de cellules tumorales. Le comportement du système aux temps long est cependant perturbée par les mécanismes de régulation de la prolifération cellulaire et un état d'équilibre est atteint où les agrégats de cellules forment une structure symétrique en points, en bandes ou en quadrillage. Ces prédictions permettent de mieux comprendre la présence de points et de globules pigmentés au sein de ces lésions, de taille, de forme et de répartition uniforme dans les tumeurs bénignes, et plus irrégulière dans les mélanomes. On s'intéresse finalement à la peau glabre et on illustre comment la géométrie particulière de l'épiderme dans ces régions influence l'aspect des tumeurs. En montrant comment le transport et la répartition de la mélanine est modifiée on propose ainsi une explication à l'apparition des bandes parallèles pigmentées et à la localisation des colonnes de mélanine. Afin d'étudier l'influence de la géométrie sur la répartition des cellules tumorales on développe un modèle multiphase en couche mince sur surface courbe. On propose ainsi un mécanisme expliquant la localisation d'agrégats cellulaires dans les crêtes épidermiques

    Extraction de séquences numériques dans des documents manuscrits quelconques

    No full text
    Within the framework of the automatic processing of incoming mail documents, we present in this thesis the conception and development of a numerical field extraction system in weakly constrained handwritten documents. Although the recognition of isolated handwritten entities can be considered as a partially solved problem, the extraction of information in images of complex and free-layout documents is still a challenge. This problem requires the implementation of both handwriting recognition and information extraction methods inspired by approaches developed within the field of information extraction in electronic documents. Our contribution consists in the conception and the implementation of two different strategies: the first extends classical handwriting recognition methods, while the second is inspired from approaches used within the field of information extraction in electronic documents. The results obtained on a real handwritten mail database show that our second approach is significantly better. Finally, a complete, generic and efficient system is produced, answering one of the emergent perspectives in the field of the automatic reading of handwritten documents: the extraction of complex information in images of documents.Dans le cadre du traitement automatique de courriers entrants, nous présentons dans cette thèse l'étude, la conception et la mise en \oe uvre d'un système d'extraction de champs numériques dans des documents manuscrits quelconques. En effet, si la reconnaissance d'entités manuscrites isolées peut être considérée comme un problème en partie résolu, l'extraction d'information dans des images de documents aussi complexes et peu contraints que les courriers manuscrits libres reste à ce jour un réel défi. Ce problème nécessite aussi bien la mise en \oe uvre de méthodes classiques de reconnaissance d'entités manuscrites que de méthodes issues du domaine de l'extraction d'information dans des documents électroniques. Notre contribution repose sur le développement de deux stratégies différentes : la première réalise l'extraction des champs numériques en se basant sur les techniques classiques de reconnaissance de l'écriture, alors que la seconde, plus proche des méthodes utilisées pour l'extraction d'information, réalise indépendamment la localisation et la reconnaissance des champs. Les résultats obtenus sur une base réelle de courriers manuscrits montrent que les choix plus originaux de la seconde approche se révèlent également plus pertinents. Il en résulte un système complet, générique et industrialisable répondant à l'une des perspectives émergentes dans le domaine de la lecture automatique de documents manuscrits : l'extraction d'informations complexes dans des images de documents quelconques
    • …
    corecore